Analisis Data Ecoli dengan KNIME#

Konfigurasi KNIME#

Screenshot 2025-10-09 125104.png

Screenshot 2025-10-09 125143.png

Screenshot 2025-10-09 125218.png

Screenshot 2025-10-09 125239.png

Screenshot 2025-10-09 132310.png

Screenshot 2025-10-09 132500.png

Screenshot 2025-10-09 132514.png

Screenshot 2025-10-09 132542.png

Screenshot 2025-10-09 132629.png

Konfigurasi miniforge prompt#

Screenshot 2025-10-09 133030.png

Screenshot 2025-10-09 133038.png

Screenshot 2025-10-09 133616.png

Screenshot 2025-10-09 133145.png

Analisis#

Ambil data dari database Postgre#

  • Drag node PostgreSQL Connector kemudian klik untuk menautkan dengan database anda, lalu Apply dan OK. Kemudian run agar node jalan hingga node selanjutnya.

image.png

image.png

Menampilkan Data#

  • Drag node DB Reader untuk menampilkan data

image.png

Deteksi Missing Value#

  • Drag node missing value

  • Sambungkan Node DB Reader ke node missing value lalu run

  • Hasilnya kolom Missing Value nilainya 0 karena tidak ada missing value di data

image.png

Deteksi Outlier#

  • Drag node Numerik Outliers, konfigurasinya seperti gambar dibawah ini

image.png

  • Drag Node Rule Engine untuk menandai bahwa data adalah outlier atau bukan, outputnya Normal dan Outlier

  • Klik dan masukkan code untuk menandai tiap kelas di field Expression

MISSING $mcg$ OR MISSING $gvh$ OR MISSING $lip$ OR MISSING $chg$ OR MISSING $alm1$ OR MISSING $alm2$ OR MISSING $aac$ => "Outlier" TRUE => "Normal"

image.png

  • Drag node Color Manager untuk mewarnai data outlier dan normal

  • Pada field Color by .. pilih kolom flag_outlier

image.png

Ploting untuk deteksi Outlier#

  • Drag node Scatter plot (JavaScript) (Legacy)

  • Centang Create image at Outport

  • Pilih kolom untuk X axis dan Y axis

image.png

Penghapusan Outlier#

  • Drag node Raw Filter

  • Filter column: flag_outlier

  • Operator: Equals

  • Case matching: Case sensitive

  • Value: Normal

  • Filter behavior: Output matching rows lalu Apply

image.png

image.png

  • Jumlah data sebelum penghapusan Outlier adalah 336

  • Jumlah data setelah penghapusan Outlier adalah 319

Balancing data menggunakan SMOTE#

  • drag node SMOTE

  • konfigurasi :

    • class column : class

    • Nearest Neighbor : 5

    • Oversample minority classes ✅️

  • Apply

Visualisasi data setelah balance#

  • Drag node Value Counter dengan memilih column class lalu Apply

  • Drag node Bar Chart, pindah count di Exclude ke field Includes lalu Apply

image.png

Hasil akhir kumpulan node#

image.png